查看原文
其他

定量研究被滥用了吗?

公共行政研究 公共行政研究 2022-08-06

《公共管理学报》:定量研究在公共管理学科中被滥用了吗? 

 

于文轩、 樊博


摘要:经过30多年的发展,中国公共管理学术研究取得了惊人的发展和成就。其标志之一是定量研究方法的出现和崛起。然而定量研究方法在国内公共管理学界是在争议和质疑中发展的。本文指出由于学科发展刚刚起步,定量研究在公共管理研究中的使用确实存在一些问题,但是对定量研究方法的认识要建立在对定量研究方法的本体论和认知论的基础上,定量研究方法的发展是社会科学认识和改造世界重要的武器。当前在中国公共管理学研究中定量研究方法不仅仅没有被滥用,反而是发展的不够。认为定量研究方法被滥用一部分是由于对定量研究方法在社会科学研究中应用的认识有误区,一部分是因为中国公共管理学对定量研究方法的教学和训练还不够,离公共管理学研究的现实需要还有差距。本文希望可以厘清一些长期以来困惑定量研究在公共管理领域使用的一些问题,为定量研究方法的论文写作和公共管理学定量研究方法教学提供一些建议。中国公共管理学界要大力推进和发展定量研究方法,大力提升定量研究的水平。




关键词: 中国公共管理研究、方法论、研究方法、定量研究方法

      

        过去20年多年间,中国公共管理学研究在老中青学者的共同努力下取得了惊人的成就。从学术研究的发展上来看,一个突出的标志是实证研究导向和定量研究的出现和崛起。国际公共管理学研究越来越趋向定量化[1],在公共管理学研究最相关的政治学研究领域,定量化研究更是占据支配性地位[2]。美国哈佛大学政府系教授Gary King每年给新录取的博士生举办“数学唤醒” 方法营,培训博士生必备的数学和计算机编程知识,为博士生阶段的学习和研究做准备[3]。发展定量研究对于中国公共管理学科发展的国际化和范式转变,以及更好的用国际学术界通行的语言和逻辑,向国际社会讲述中国故事有非常深远和重大的影响和意义[4]。

         过去三十年中国公共管理研究发展的巨大成就的标志之一是经验研究(Empirical Studies)的发展和被广泛认可。作为一门以应用和解决现实问题为导向的学科,公共管理学界对实证研究的重要性和意义已经没有争议。现在争议的焦点是到底哪个研究路径,定量研究还是定性研究,更适合当下中国公共管理研究。近年来随着定量研究方法在中国公共管理领域的应用和发展,批评和质疑定量研究的声音开始出现[5-8]。一个非常有意思的现象是定量研究的文章在公共管理学术期刊上在短暂的高速发展之后,开始下降[9]。这和学界对定量研究在公共管理领域的使用的反思有关。本文结合公共管理学界对定量研究的质疑和批评,从定量研究的方法论和本体论的哲学基础,定量研究的旨趣和常见的对定量研究的误解等方面回应这些批评和质疑,这些批评除了是建立在哲学层面对定量、定性和思辨规范研究进行探讨的基础之上以外,更多的是对定量研究自身的局限性和好的定量研究和坏的定量研究的区别缺乏一致性的意见。本文分为四个部分,在第一个部分我们讨论科学、社会科学和定量研究的旨趣。第二部分我们对常见的对定量研究的批评和误解进行评论。第三部分我们分析什么是好的定量研究。最后我们针对以上的讨论进行总结。

 

一、  科学、社会科学和定量研究

 

        混沌初开,人类就对自身态度、行为、关系和各种社会活动充满好奇心,试图去理解、解释和预测。人类从神话,到宗教,到哲学思辨,再到现代实证研究,发展出了社会研究(Social Inquiry)的好几种范式。Guba and Lincoln 按照本体论,认知论,方法论,研究的目的,知识的本质和质量标准把不同社会研究的范式列为实证主义、后实证主义、批判理论 和建构主义[10]。Crewell 将实证主义和后实证主义整合在一起,认为社会研究有后实证主义、建构主义、倡导/参与和实用主义[11]四大范式。这里我们说的是社会研究,没有说社会科学。是因为社会科学是伴随着科学的兴起而兴起的。社会科学遵循的范式是实证与后实证主义。按照Gray 等人的说法,科学是一个方法体系。这个方法是一个研究循环,人们从直觉开始,形成理论,发展假设,然后收集数据并进行假设的证实或证伪。然后人们根据自己的研究发现,在调试和发展自己的理论。科学的方法的核心目的就是要进行一般化(Generalization)[12]。

       在人类历史上,科学方法的思路的形成并不长,18世纪才初步成型。在那个时候自然科学开始探索宇宙物理世界的运行规律,试图发现物理世界的运行规律。科学家们开始设立实验室,进行科学实验。社会思想家被物理学、生理学和药学等学科的发展所激励,试图发现关于人类行为的法则和理论。但是一开始他们并没有采纳今天科学的方法,而是采用哲学思辨的形式。直到进入19世纪,社会研究者才开始进入社会现实,研究在真实场景下人们是如何行为和互动的。法国学者托克维尔1835年根据他在美洲大陆的观察和体验写成《美国民主》一书。他书里展示的对真实世界(当时美国的文化和社会)运行细节的关注和理论对实践的关照,给人们很大的震动。19世纪哲学家孔德试图将社会研究和神学和形而上学区分开来,提倡实证主(Positivism)。实证主义的核心观点是在物理和自然科学中使用的科学研究原则可以被应用到对社会中人类行为的研究中。尽管孔德鼓吹实证主义,但是真正把科学技术应用到社会研究中的确是《物种起源的作者》达尔文。他把19世纪两大思潮,自然科学思潮和关于人类发展和进步的思潮,结合在一起。稍后受达尔文启发,斯宾塞将社会发展和生物进化论结合在一起。这直接为之后杜克海姆和韦伯将社会观察的技术和跨文化比较的研究铺平了道路。弗洛伊德和心理学家们开始使用生物和生理学研究人类心理和认知[12] 。

        进入20世纪以来,自然科学特别是物理学的巨大进步,让社会科学家非常振奋。二战期间,电脑技术和数据处理技术的发展,使统计调查方法取得了巨大进步。大规模问卷调查成为可能,定量社会科学研究风光无限。这个实证主义社会科学在美国得到了发扬光大,其原因有三。一是美国经验主义哲学的传统,二是美国的实用主义传统,三是电脑技术和统计学在美国的迅速发展 [13]。信奉实证主义的社会科学家们相信自然科学的方法可以用来研究社会。从本体论的角度上看,他们认为现实(Reality)是真实存在的,是可以理解的。从认知论的角度上看,研究的客体是客观的,可以把研究者和研究对象分开。从方法上看,实证主义认为要采用实验和统计定量的方法对社会进行科学研究。从研究目的角度上看,研究的目的是解释、预测和控制。实证主义者认为他们产生的知识是被验证的假设,这些知识是事实或者法则。他们认为好的研究标准是内部和外部有效性,稳定性和重复性和客观性。

       由于社会科学的异常复杂性,实证主义者的观点受到了现实的严峻挑战。已Popper为代表的科学技术哲学家对实证主义进行了扬弃,发展出了后实证主义。之所以是后实证主义而不是其他实证主义,乃是因为他们的核心观点基本一致,只是后实证主义对实证主义进行了调整。后实证主义也认为现实是真实存在的,但是人可能只能不完美的和在概率论意义上可以对之进行理解。真理是可以被无限逼近的,但是可能人们永远无法发现它。后实证主义者同样认为应该把主观和客观相区分,但是他们采取更具有批判精神的立场,他们认为各种研究发现存在各种各样的问题,因此要对研究发现进行审视和批判。研究发现有可能是对的也有可能错的。在研究方法上,后实证主义者认为假设是无法证实的只能证伪。可证伪是科学理论的重要标志。他们主张在真实情景里进行社会研究,因此定性研究方法也很重要。后实证主义认同实证主义对知识的本质的基本主张,但立场更灵活,认为不能被证伪的假设并不见得是错的,只是无法被证伪[14]。正是基于此,社会科学方法论研究者现在基本上把实证主义和后实证主义放在一起当作是社会研究的一大范式。后实证主义的哲学观在哈佛大学政治学教授Gary King 那里体现的淋漓尽致。他认为判断研究方法是否科学的主要标准就是进行推论,进行描述性推论和因果推论。定性研究如果是社会科学研究的话,也要采纳定量研究的逻辑和原则,遵循一样的质量检验标准[15]。

        在这个后实证主义的传统里,科学技术哲学家库恩在其名作《科学革命的结构》中提出了常规科学(Normal Science)和范式(Paradigm)的概念。他指出在一个时空范围内,一群科学家会形成一个科学共同体,他们会拥有一个范式。在这个范式里他们对本体论、认知论和研究方法的看法基本一致,对他们认为重大的问题进行科学研究,直到他们现有的范式无法解释的新现象的出现。这个时候他们就会进行范式转移(Paradigm Shift)。科学就是在范式的不断转移变化中得到发展的[16]。这个后实证主义范式在美国社会科学界是支配性范式。即使在看来多范式并存的政治学和公共管理学界,这个范式也是支配性的。在公共管理学界尽管前有60年代的Waldo和Simon之争,后有Luton和Meier的辩论,作为后实证主义范式的集大成者的定量研究支配者美国政治学和公共管理学研究。Gary King 的 《Designing Social Inquiry: Scientific inference in qualitative research》和 库恩的《The Structure of Scientific Revolution》是美国公共管理学博士生教育的必读书。

        因此当我们看待公共管理研究中定量方法的时候,应该从后实证主义和常规科学的范式来看。定量研究方法是在一个科学共同体内,一群社会科学家进行研究的工具和方法。之所以采纳定量研究方法,是因为定量研究方法是最符合体现后实证主义和常规科学要求的研究工具。从这个角度上看,定量研究方法和定性研究方法没有本质的不同,都是服务于一样的研究目的,需要服从一样的研究标准和逻辑。从后实证主义和常规科学的视角上看,定量研究的主要作用是检验和发展理论。没有完美无缺的定量研究,社会科学家们应该采用批评性和更宽容的视角看待定量研究的成果,由科学共同体一起来审视研究的质量,建立在过去和现在的研究基础之上,在一个范式里进行科学研究,发展社会科学理论。


二、 对公共管理定量研究的批评

 

        在政治学和公共管理学界,定性和定量研究之争从来没有停止过。从方法论的角度上看,定性和定量研究之争不是方法之争而是后实证主义常规科学和其他研究范式之争。因为按照后实证主义常规科学的传统,定性研究方法也要服从相同的本体论、认知论和方法论的要求,也要满足一样的研究质量要求。从这个意义上说,只要我们认为公共管理学研究是社会科学研究,采纳后实证主义常规科学的研究范式是唯一选择。至于定性还是定量研究并不重要,只是因为定量研究方法是最完美体现社会科学研究旨趣的方法。此外由于定性研究存在多个学术范式和传统,学术体系庞杂,学术研究没有清晰和公认的研究体系和程序,学术产生的知识也没有共同的评价标准。由于很多范式不以解释和预测目的,不追求知识的一般化,因此所产生的知识在现实应用性和改造现实的作用上也远远不如后实证常规科学范式。特别由于没有清晰和公认的研究体系和程序,学科训练和知识积累都相当困难,不利于学科人才培养和知识的增长。因此后实证常规科学在美国社会科学界的支配地位就很容易理解了。由于美国在科技创新领域的支配性地位,后实证常规科学也常被认为是美国霸权在社会科学研究中的体现[8]。

        当前对中国公共管理定量研究的批评主要集中于定量的哲学基础,定量研究测量的科学性,定量研究没有理论,定量研究的模型是对现实的过分简化,定量研究的发现都是常识,定量研究的理论意识和实践意义等。在这些批评中,有些是对公共管理定量研究不了解所致,错误地认为公共管理研究是因为理性人假设和对工具理性、技术效率的追逐才使得定量研究方法大行其道。最近刘润泽、巩怡萱两位学者对《公共管理学报》过去15年发表的定量研究文章进行了评估,对该杂志过去15年发表的310篇定量研究论文进行了聚类分析(以下简称刘巩文)[9],认为定量研究方法在中国公共管理研究中得到了滥用。突出表现为 1)研究选题的平庸,用复杂方法验证常识,结论域大于问题域。2)研究方法平庸,代理变量不匹配,R2过小或被抹去,轻率设定因果关系和控制变量,数据来源缺乏信度,样本选取不符合科学抽样原理 。3)研究预设的平庸。他们文章非常可贵的是结合每一类问题都给出了非常具体的例证。这些发表在《公共管理学报》上的定量研究论文基本上可以代表国内公共管理定量研究的水平。这些批评有一些属于技术部分,属于定量研究质量高低与否的问题,有一些批评我们认为有一些误解,需要更动态和全面的看待公共管理的定量研究。我们认为如果不对其中的问题进行厘清,会存在一定程度的误导,影响定量研究在国内公共管理学研究的的发展。

 

    1.  定量研究是使用复杂方法验证常识吗?

 

    对定量研究最常见的批评是定量研究费这么大劲,用相当复杂的统计方法,结果发现的是常识。这个批评有合理的成分,有一部分研究的选题确实在理论上和实践上意义不大,结论貌似是不用研究就可以看得到的。但是认为定量研究使用复杂方法验证常识,却是对定量研究旨趣的误解。定量研究的主要研究目的不是构建理论,而是检验理论和对理论进行证伪,发展理论和一般性知识,用来增进我们对事实的了解和指导实践。常识其实是一些没有被支持的观点,或是受不充分和不可靠信息影响的态度。常识其实是一些没有经过检验的假说。对于个人而言,常识的对错,没有太大的问题。但是对于社会科学研究来说,常识如果不经过系统性的检验,是非常不可靠的。事实上,国家、政府、组织和个人是不可以依靠常识来进行管理和运作的。

    常识不靠谱主要有以下几个原因。第一、个人所处的位置的局限性。每个人看问题的立场和角度都受个人认知的局限性。结构功能主义认为语言、环境都对个人产生深刻的影响。每个人的知识背景和结构,以及所处的社会经济地位都不同,看问题的角度也不同。个人能收集到的信息也是非常有限。另外有些事务离个人很遥远,人人看起来都有自己的判断,很多听起来可以自圆其说的理论,看起来非常合理,符合常识,但是经不起审视和检验。比如说美国为什么和北朝鲜在新加坡会面,每个人都有自己看起来可以自圆其说的理论,并依据此进行解读。显然没有充分系统的收集信息和按照科学的方法对之进行检验,常识是靠不住的。第二、常识往往来源于熟悉。常识的产生是因为对事物非常熟悉。比方说在新加坡人们吃完榴莲之后,总要用榴莲壳承装盐水来去除所谓的火气。于是榴莲壳装盐水可以去除火气已经成为人们的常识。但是这样的常识可靠吗?事实上因为熟悉而产生的常识也是不可靠的。我们可能对某些东西很熟悉,但是熟悉不是理解。熟悉某件事情不见得懂其中的道理。比方说一个生活在美国的研究美国公共管理的学者,他对美国公共管理的认识要比一般美国人全面和深刻的多,因为他有专业的训练和专业学习。 人类社会、制度和行为是非常复杂的。研究社会需要系统性的研究,而不是靠单单靠个人的经验和观察。

    第三很多常识来自于人类的情感。常识靠不住,是因为我们有情感和好恶。我们的情感好恶会决定我们对事物的看法,迷惑我们的判断。心理学家早已发现人有各种各样的心理偏差。这样的偏差决定了人们对事和物的看法。人们往往把这些看法当成是不需要检验的常识。现代医学之所以发展起来,极大的提高了人类消除疾病的能力,极大的提高了人的寿命,正是因为现代医学不相信常识,采用以证据和双盲可控制实验的方法,对常识进行科学检验。在公共管理领域,建立在实证基础之上的循证公共政策制定的兴起就是要通过科学的程序,用证据说话,摆脱传统的拍脑袋、靠常识的决策,提升公共政策制定的科学性和有效性。因此研究发现是否是常识并不是评价定量研究质量的标准。

        刘巩文中提到的一篇采用2012-2016年中国283个地市级平衡面板数据的研究,发现环保约谈能够有效提高地方政府环境治理效率,约谈效果逐年递减的,不具有长效性的论文。刘巩文认为这篇文章使用了很多数据以及复杂数学方法得出的却是常识性结论。事实上这一结论并不是常识。这是很典型的通过使用反事实的研究方法,通过多种统计手段对单差法的适用性和模型可能存在的内生性进行解决并对研究结果进行稳健性检验的政策评估论文。如果不是经过这样的定量研究,我们是得不出这样的结论的。没有这样的研究,我们是不知道环保约谈到底有没有效果的,也不知道这样的政策的效果是大是小,有长期还是短期影响的。这样的研究是有很显著的现实指导意义的。政策制定者和执行者会对当下采用的环保约谈制度进行重新评估和制度改进。这篇文章使用多种统计技术进行因果机制的识别和进行稳定性检验,恰恰说明公共管理领域使用定量研究方法越来越成熟,研究结论越来越可靠。

 

        2. 定量研究是对现实的不切实际的高度简化吗?

 

        刘巩文中指出有的定量研究文章是结论域大于问题域,代理变量不匹配,轻率设定因果关系和控制变量等问题实际上是和如何认识定量研究中理论的作用和定量研究如何发展理论有关。人类社会确实非常复杂,对人类社会规律的研究非常困难。定量研究的就是要把高度复杂的人类社会高度简化,概念化,把复杂的社会现象,人的态度,行为抽象成概念和命题,然后通过可操作化(Operationalization),将这些概念可测量化,来对社会进行研究。

        定量研究的核心是推论,是进行描述性推论或者因果性推论。定量研究往往需要选取样本,通过对样本的研究,推断出总体的特点。刘巩文指出的那篇使用20世纪70年代到现在500多条政策口号,通过文本分析研究地方绩效观的文章正是采用的这个逻辑。地方政府绩效观是一个很宏大的总体性概念,对总体概念的研究,由于数据可获得性等方面的限制,必须选择具有代表性的样本或根据研究要求选择最大可能或最大不可能的样本。该作者所采取的策略就是最大不可能,就连最不可能有绩效观变化的计划生育工作的绩效观都在不断变化和改进,当然地方政府的绩效观变化和改进了。

         定量研究使用简单的可测量的指标对复杂社会现象的测量,就是刘巩文中指出的代理变量不匹配的现象。实际上在各种限制的情况下如何使用代理变量对复杂概念进行可操作化和测量是定量研究既是科学也是艺术的迷人之处。在各种资源和数据的限制下,定量研究者是带着镣铐跳舞。和定性研究者相比,定量研究者需要更高的理论概括和抽象的能力,并能创造性的结合自己的资源和条件,螺蛳壳里做道场,富有创造力的选择代理变量(Proxy variables)。比如为了解决自变量的内生性问题,定量研究者会寻找一个工具变量,这个工具变量只和自变量相关,和因变量没有直接关系,和因变量的间接关系只能通过这个自变量。寻找这样的工具变量,按照马克思辩证唯物主义事物是普遍联系的理论,在现实世界里是非常困难的。但是聪慧的研究者总能找到惊为天人的工具变量,让人叹为观止。

         社会科学理论的最高境界是发现因果。不能进行因果推断的理论不是成熟完善的社会科学理论。发现因果关系的黄金研究方法是可控制实验室实验。由于公共管理学研究的是人类社会和真实世界,可控制实验很多情况下是不可能的,或由于不符合伦理道德规范,是无法进行的。因此传统的定量研究高度依赖现存的社会科学理论,通过理论来指导模型的建立。在对以往研究和理论模型构建的回顾和借鉴的基础之上进行模型构建时,定量研究者会说明是如何根据理论,进行建模的。在建模的过程中,研究者以简洁为追求,尽可能多的涵盖所有必要的重要变量,然后竭力说明重要变量并没有被放置到残误项中。这是非常典型的结构形的计量建模分析路径。即使如此研究者往往在研究的讨论部分,还是会很谨慎的说明自己研究的局限和未来研究的发展方向。近年来随着应用经济学的发展,计量经济学家发展出用可观察数据来模拟和逼近实验室随机实验的准实验和自然实验的计量分析工具,这样的数据导向的简化型的计量数据分析极大的减少了对结构模型的依赖,通过控制组和对照组的巧妙设计和安排,发现和验证自变量和因变量的因果关系。

 

         3.   定量研究中 重要吗?

 

        刘巩文指出公共管理学定量研究中,有的研究过低 或不报告,因此研究质量不高。实际上这是对值使用的误解。在传统初中级计量经济学教学中,高度强调对模型拟合程度的重要性,认为在线性横截面数据中  可以解释在多大程度上因变量可以为自变量进行解释。然而对于应用计量经济学家而言他们要进行实际的数据分析,他们的模型也要比线性横截面数据复杂的多。在实际的模型构建和数据分析中其实并不重要,对模型构建和拟合度意义都不大。即使在线性横截面回归模型中,当自变量增加时,就会增大。在时间序列模型中  就是比横截面数据高。在面板数据里长面板的也会比短面板的  高。此外也不存在一个科学的评判高低的标准。到底多高是高,单看这个指标是无法判断的。社会是极其复杂的,发展一个模型,即使只能解释因变量的很小一部分,这个模型也是很伟大和显著的。在面板数据分析中如果使用STATA软件,STATA软件汇报的是所谓的假,它和横截面数据中的有不同的含义。因此实用计量经济学家已经不关心到底是多少,他们更关心是研究的目的和模型的构建,更关心整个模型的显著性。如果模型构建有问题,再高的也没用。

         1983年美国计量经济学家Leamer批评经济学家的实证研究有大量模型形式上的和数学上的“假设”,而不同的假设会带来不同的结论。这样的实证的结论没有充足的说服力。人们可以轻易地得到他们想要的结果。Leamer给出的一个解决方案,是稳健性检验,也就是说研究者需要展示和说明,实证结果是如何随模型形式变化而变化的。随着应用计量经济学家的共同努力,研究设计成为解决不靠谱的定量数据分析的救命药。通过采用随机控制法(RCT)和自然实验法(IV,RD,DID等)方法,学者们不再紧紧盯着计量结果,而开始反思实验设计过程[17]。比如在传统计量经济学教科书中,横截面数据的异方差性是个很严重的问题,但是现在的应用经济学家已经对这个问题不关心了,对他们而言使用White-heteroskedasticity robust standard error就足够解决这个问题了,他们把注意力放到了研究设计和因果关系识别机制上[18]。

 

三、什么是好的定量研究

 

       结合我们上面的分析,我们认为:

1.好的定量研究需要展示作者对定量研究的哲学基础和定量研究局限的认识。

    如前文所言,定量研究的哲学基础是后实证主义常规科学。在一篇好的定量研究的文章里,尽管作者不用对之进行专门的讨论,但是作者行文的字里行间,到作者变量的选择和测量的使用,以及对研究意义和发现的陈述,都应该展示作者对以逻辑实证主义为基础的,以统计推断为方法的定量研究的深刻理解。这一理解决定了作者如何在一系列的限制条件之下,进行变量的选择和测量,以及统计方法的使用和对数据的分析。

2.好的定量研究应该高度重视变量的测量。

         定量研究是逻辑实证主义为基础的,强调的是对社会科学研究对象的概念化,可操作化和测量。好的定量研究对测量,以及测量工具的使用有很高的要求。过往公共管理研究包括美国公共管理研究一个很大的问题,是过度依赖对问卷的使用。通过发放问卷,使用莱克特量表,对研究的因变量和自变量进行测量。随着公共管理定量研究的发展,人们对使用问卷进行变量的测量,产生了相当大的疑虑。尽管这个疑虑有一定原因,但是也不能把问卷方法一棒子打死。如果测量和研究的是主观心理和态度,问卷研究方法仍然是一个重要的研究方法。在这时候,我们关注问卷设计的科学性,看是不是能得到对心理和态度的真实和可靠的测量。问卷使用中的共同性偏差的问题(Common Biases) 已经得到了各主流学术杂志的高度重视,这使得定量研究中使用单一问卷收集数据的文章越来越难以发表。过往不少研究对把通过问卷收集来的对变量的测量即对主观感知的测量当成是客观测量的代理变量的做法现在已经很难被接受了。越来越多的国际公共管理研究期刊希望研究者使用不同数据源的数据(多个问卷的数据或来自不同数据源的主客观数据的混合)进行论文写作。当下随着行为大数据研究的兴起和实验研究的兴起,定量研究的重点开始从对态度的研究向行为转变,这个时候大数据和实验会是下一步公共管理定量研究的重点。公共管理研究领域中方兴未艾的行为公共行政学研究就是希望通过使用实验,即使是使用问卷实验,在一定程度上挽救长期以来一直被批评的问卷研究方法。

         3. 好的定量研究一定要有理论支持和理论贡献。

         好的定量研究的对于定量研究应该构建什么样的理论及其理论意义高度重视。尽管定量研究和其他研究范式在理论构建上,先天不足。但是通过定量研究发展理论是非常重要的.Sutton & Staw 对管理学领域定量研究的理论化做出了批评。他们指出定量管理学者对什么是理论存在很多误解。他们指出 1.堆砌参考文献不是理论;2. 数据本身不是理论;3. 罗列变量和构建(Construct)不是理论;4 . 图表不是理论;5. 假设或预测不是理论。和管理学一样[19],公共管理学研究发展的不是元理论和宏大理论,公共管理理论是中层理论,是一系列阐明变量间关系的定理的集合。Whetten 认为好的管理学理论贡献就是要明确回答,谁,什么,在哪里,什么时候和为什么,还有如何的问题。 在所有这些需要回答的问题里,最重要的理论问题是为什么的问题。Kaplan 和 Merton都明确指出理论就是对why 问题的回答。 理论就是关于现象的联系,关于为什么行为,实践,和思想会发生。理论强调的是因果关系的本质,界定时间发生和因果的顺序。一个好的理论就是要深挖潜在过程,以帮助我们发现和理解一个特定事件发生和不发生的系统性原因[20,21]。 一些定量研究学者对公共管理研究中的理论认识的不够,经常堆砌文献,以为呈现数据及其关系以及罗列研究假设,画模型图就是理论,忽视对理论最重要和核心问题,因果逻辑链条的分析和深入讨论。好的定量研究会在呈现出变量之间的相关性后,进行统计学上的或理论分析上的分析,对变量间因果逻辑的验证和讨论。

        4.  好的定量研究一定要建立在已有的研究基础之上,对已有研究在理论和方法上进行扩展。

         对公管定量研究理论性不够的批评主要集中在两个方面,一是定量研究者对国内、国外文献的述评非常不够。不少作者就是找一个有一定实践价值的问题,匆忙建模,然后跑数据,之后对数据发现进行分析,而且分析的结果高度依赖统计软件跑出来的结果,比如系数的大小,显著性和方向。一个很大的问题是这样的研究如果没有充分的对已有理论的述评,没有很好的建立在以前研究的基础之上,模型的建构会出很大问题。模型界定(Model Specification),遗误变量(Missing Variables) 问题会非常严重,这会直接导致统计推断有严重偏差和不一致。对于高度依赖统计结果的研究,这是致命伤。

         好的定量研究具有知识的积累性,会对研究问题进行充分的文献述评,不仅将研究建立在已有的理论基础之上,更要强调研究的积累性,即该研究是否建立在以往的研究基础之上的知识累加型进步,贡献于整个理论的建立和完善。这是检验一个定量研究理论意义的重要标准。一个例子是于文轩在2016年公共管理学报上发表的《中国智慧城市建设的技术理性与政治理性》一文后, 楚志华和李志超先后都从理论框架和研究方法上进行了扩展和更新,这一系列研究帮助我们理解了中国地级市智慧型城市建设的原因和动力机制,对智慧型城市研究在理论上和方法上都有贡献[22-24]。

        此外好的定量研究要对普遍理论有贡献。好的定量研究不能只停留在中国研究的层面。好的定量研究应该对一般性理论体系有贡献。有的作者在讨论自己的定量研究时,指出已有的研究没有用中国数据进行检验,自己的研究的贡献就是用中国数据扩展了理论的一般性。这样的研究如果没有指出使用中国数据带来的理论的重大改变和解释为什么中国数据会带这样的变化,理论贡献是非常有限的。可喜的是国内的学者已经开始在这方面有所突破,在国际学术期刊发表研究,用中国做为案例,贡献于国际公共管理研究的知识增长的研究越来愈多。

          5. 好的定量研究的结果不仅仅是常识(Common sense)的,也应该是愉悦(Delight)。

         优秀的定量研究论文不单单可以对Common sense给出实证证据,优秀的定量研究论文往往可以让我们有很多惊喜,在我们熟视无睹的现象背后发现规律和出人意料的关系。一个优秀的定量研究论文读后可以让人恍然大悟和充满喜悦。如Weick所言,一个好的研究可以解释,预测,也可以让我们愉悦(Delight)[25]。

           6. 好的定量研究必须使用合适的科学的研究方法。

          好的定量研究其实对研究者的要求很高。不仅研究者需要有深刻的理论功底,发现有意思的研究问题。研究者更要对收集来的复杂的数据进行技术分析,寻找最适合数据分析的研究方法。这是一个非常技术和复杂的过程。在数据清理和分析的过程中,研究者要创造性的解决定量研究教科书上没有介绍的各种问题。由于发展的比较晚,传统的公共管理定量研究方法的传授基本上停留在统计和计量经济学教学本科生的阶段。学生对定量研究方法知其然而不知其所然。对数据分析方法的使用的原因,特别是在条件非常复杂的实际研究过程中不甚了了,垃圾进,垃圾出,使用所谓的程序模版进行研究,非常容易忽略特定定量研究方法所依赖的假设和条件。如前文所言,在过去的10多年里,计量经济学领域对传统计量经济学的教学进行了反思,批评了以往计量经济学教学领域过于重视理想状态下的数学推导,而忽视了在复杂现实里的应用。因此计量经济学教学和科研兴起了“可置信的革命”。对于以应用和实践为导向的公共管理学而言,应该继续进行定量研究方法使用的更新和成熟,使公共管理学定量学者拥有可以在真实数据环境下进行数据分析的能力。此外由于公共管理研究的对象非常复杂,除了理论上要进行要素和机理的分析,为了使统计模型的建立和统计推断的结果更可靠,公共管理定量研究还要在稳健型检验上(Robust Check)上下大功夫,采用各种方法,检验和证明理论模型的稳健性和可信赖性。

         7. 好的定量研究必须是清晰的、透明的和可复制的。

         当前中国公共管理的定量研究一个非常突出的问题就是文章的作者对整个研究方法、数据的出处、属性,自己的模型,以及研究发现都没有充分和仔细的汇报。有的研究介绍完因变量和自变量之后,匆匆地说一下自己是什么方法,连模型的建构都不谈,就直接汇报结果了。模糊不清晰的研究过程的汇报,会让人对研究结果的可信度和质量产生深深的怀疑。是整个研究过程需要透明,数据要透明,模型要透明,数据分析过程和分析软件的代码要透明。

          90年代美国哈佛大学政府系教授Gary King就开始在美国政治学界大力倡导研究过程和研究数据的透明。要做到作者提供的信息,足可以复制作者发表的全部内容。今天,美国经济学和政治学界的顶级期刊,要求作者在论文被接受后提供论文的数据和统计软件的程序代码,以供查验和其他学者的复制。这样的做法一是可以保证文章的质量,二是有研究指出提交了数据和程序的文章会大大提高研究的被引用率和影响力。Gary King的研究也指出由杂志出面进行数据开放和透明,是最有效的形式[26]。中国公共管理学科的研究能力和成果评价体系正在从已发表数量为主到发表质量为主的转换,在这个节点上,推动数据公开和透明,可以极大提高国内定量研究教学和研究质量的改进和提高。中国学者现在使用的大量的数据是使用纳税人的公币完成收集的,本来就应该公开。当然,中国的政策环境,学术共同体的建立和学术发表的环境和美国不同,如何推动数据和研究过程的透明和公开,推进研究的可复制化还需进一步深入研究。如果一旦可以得到推动,对中国公共管理定量研究的教学和研究质量的提升将有重大意义。

 

四、结语

 

需要郑重指出的是,我们绝对不认为定量研究比定性研究更好,实证常规科学范式比其他研究范式更好。不同的研究问题,采用不同研究范式,采用不同的研究方法是学科历史发展,学科共同体和研究者个人背景和喜好决定的。本文旨在对定量研究方法在公共管理研究中应用的哲学和方法论基础,以及定量研究的旨趣进行介绍和分析,对人们普遍的对定量研究的一些误区进行解释说明。和定性研究方法一样,定量研究方法也是一种语言,一副眼镜,决定了研究者看待世界的角度和方法,也决定了世界在研究者眼中的样貌。本文指出定量研究是最符合后实证主义常规科学的方法,在认识世界和改造世界,在知识的积累和发展上,在学科体系建设和人才培养上有独特的优势。定量研究方法已经成为国际公共管理学的支配性的研究方法。大力发展定量研究方法对中国公共管理学的科学化、规范化和国际化有重大意义。用国际社会听得懂,能理解,可以欣赏的语言构建中国理论和讲述中国故事,是定量研究方法的另一重大使命。

       由于定量研究方法需要进行研究时从概念的选取,理论的构建,变量的选择和可操作化,数据的获得等个角度进行简化,思考和设计。进行定量研究难度很大,有各种各样的困难和挑战。由于人们对科学的崇拜,人们对定量研究方法产生的结论有很高的期待。事实上定量研究方法是在实证常规科学体系里科学家们共同采用的一种方法。定量研究方法产生的发现也没有那么可靠。需要学术共同体一起批评、讨论。定量研究方法自身发展也很快,会不断修正和完善自身的不足。如果我们用后实证主义的立场、态度和方法看待定量研究方法及其成果,我们对定量研究方法会更加宽容些。当前,对定量研究方法在公共管理学研究领域里的应用,我们的看法是这不是滥用不滥用的问题,而是发展的还不够,使用的还不多。认为定量研究方法被滥用一部分是由于对定量研究方法在社会科学研究中应用的认识有误区,一部分是因为中国公共管理学对定量研究方法的教学和训练还不够,离公共管理学研究的现实和人们的需要和期待还有很大差距。这对我们在公共管理学定量研究方法教学和学术发表上提出了很高的要求,各项改革迫在眉睫,时不我待。


作者:于文轩,男,美国罗格斯大学(Rutgers University)公共管理学博士,厦门大学公共事务\公共政策研究院,教授,研究方向:政府绩效管理、政府信息公开、智慧治理、比较公共行政、行政事务教育。

          樊博,男,哈尔滨工业大学管理学博士,上海交通大学国际与公共事务学院教授,研究方向:数字治理,应急治理。




 


参考文献:

      [1]     马亮. 实证公共管理研究日趋量化:因应与调适[J]. 学海, 2017, (05): 194-201.

      [2]     臧雷振, 黄建军. 美国政治学研究方法发展现状及趋势——新世纪初的新争论、挑战与反思[J]. 政治学研究, 2014, (04): 73-89.

      [3]     King G, Kuriwaki S, Park YS. The “Math Prefresher” and The Collective Future of Political Science Graduate Training[J]. PS: Political Science and Politics, 2019.

      [4]     于文轩. 中国公共行政学研究的未来:本土化、对话和超越[J]. 公共行政评论, 2013, 6 (01): 15-20.

      [5]     王勇, 卞风玲. 公共行政学定量方法运势论析——后工业社会的维度[J]. 四川大学学报(哲学社会科学版), 2008, (02): 119-123.

      [6]     颜海娜, 蔡立辉. 公共行政学研究方法:问题与反思[J]. 公共管理学报, 2008, (04): 109-115+128.

      [7]     王印红, 王刚. 对公共管理研究方法中定量推崇的批判[J]. 重庆大学学报(社会科学版), 2013, 19 (01): 64-71.

      [8]     葛传红. 西方政治学界对于“定量霸权”的反思与批判[J]. 国际政治研究, 2019, 40 (01): 117-141+116.

      [9]     刘润泽, 巩宜萱. 回顾与反思:定量研究在公共管理学科的滥用[J]. 公共管理学报: 1-13.

    [10]    Guba EG, Lincoln YS. Competing paradigms in qualitative research. In: Denzin NKL, Y.S., editor. Handbook of qualitative research. Sage: Thousand Oaks, California, 1994: 105-117.

    [11]    Crewell JW. Research design: Qualitative, quantitative, and mixed methods approaches . Thousands Oaks[M]: CA: Sage Publications, 2008.

    [12]    Gray PS, Williamson JB, Karp DA, et al. The research imagination: An introduction to qualitative and quantitative methods[M]: Cambridge University Press, 2007.

    [13]    沃野. 论实证主义及其方法论的变化和发展[J]. 学术研究, 1998, (07): 31-36.

    [14]    Gabrielian V, Yang K, Spice S. Qualitative research methods. Handbook of Research Methods in Public Administration. CRC Press: New York, 2008: 141-168.

    [15]    King G, Keohane RO, Verba S. Designing social inquiry: Scientific inference in qualitative research[M]: Princeton university press, 1994.

    [16]    Kuhn TS. The structure of scientific revolutions[M]: University of Chicago press, 2012.

    [17]    Angrist JD, Pischke J-S. The credibility revolution in empirical economics: How better research design is taking the con out of econometrics[J]. Journal of economic perspectives, 2010, 24 (2): 3-30.

    [18]    Angrist JD, Pischke J-S. Undergraduate econometrics instruction: through our classes, darkly[J]. Journal of economic perspectives, 2017, 31 (2): 125-144.

    [19]    Sutton R, Staw BM. What Theory Is Not[J]. Administrative Science Quarterly, 1995, 40 (3): 371-384.

    [20]    Kaplan A. The Conduct of Inquiry[M]. New York: Harper and Row, 1964.

    [21]    Merton RK. On Theoretical Sociology[M]. New York: Free Press, 1967.

    [22]    于文轩, 许成委. 中国智慧城市建设的技术理性与政治理性——基于147个城市的实证分析[J]. 公共管理学报, 2016, 13 (04): 127-138+159-160.

    [23]    李智超. 政策试点推广的多重逻辑——基于我国智慧城市试点的分析[J]. 公共管理学报, 2019, 16 (03): 145-156+175.

    [24]    楚金华. 中国地级以上城市智慧城市建设动因探寻——基于268个城市的事件史分析方法[J]. 统计与信息论坛, 2018, 33 (12): 82-91.

    [25]    Weick KE. What Theory Is Not, Theorizing Is[J]. Administrative Science Quarterly, 1995, 40 (3): 385-390.

    [26]    King G. The Future of Replication[J]. International Studies Perspectives, 2003, 4: 443-449.

 

 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存